老姚专栏 | 工具变量思维
本文首发于《今晚报》(2020-08-10),本推文有修订。
启研学社由知名学者担任学术顾问,高校师生与企研数据科学团队联合组建,以大数据资源及相关技术助力中国学术与智库研究为宗旨的研究组织。团队当前的主要目标是挖掘经济社会大数据资源在学术和智库领域的应用价值,开展学术大数据治理研究,以及探索大数据分析技术融入中国经济社会研究的可行进路。
两位友人曾在微信群中“抬杠”,主题是嗜甜品与糖尿病的关系。
A君嗜甜品,在最近的体检中发现血糖偏高。B君建议A君以后尽量远离甜品,但被A君“怼”回去——谁说甜品吃多了就会患上糖尿病?糖尿病也许由基因决定,而有糖尿病基因的人喜欢吃甜品。“那你就继续不忌口,等着病情变得更严重吧”,B君对A君不领情感到有些气恼。A君哈哈大笑地回应道:“你呀,就是不讲逻辑,总是用诉诸恐惧这一招来说服别人”。
具体来说,虽然通过经验观察可发现,嗜甜品者容易患上糖尿病,但正如A君所言,这并不意味着前者是因,后者是果。那么,到底该如何为因果关系提供有说服力的证据呢?此时,工具变量思维提供了解决问题的一种思路。接下来我们进行举例说明。
假设有人发现这一个事实,开糖果店的人更容易患上糖尿病
那么,该事实背后的可能逻辑是什么呢?一种解释是:糖果店主因获取糖果方便而容易吃太多的糖果,进而容易患上糖尿病;另外一种解释是:有糖尿病基因的人喜欢吃糖果,进而倾向于去开糖果店。
哪一种解释有道理?
开糖果店的首要目的应是挣钱。人们会因喜欢吃糖果而去开糖果店,这听起来有点匪夷所思。因此,我们不妨假定第一种解释是正确的。在第一种解释基础上,如果我们还假定,除此之外开糖果店不会对罹患糖尿病的风险产生任何直接或者间接的影响,那么“开糖果店的人更容易患上糖尿病”这一经验观察就有力地表明:嗜糖为因,罹患糖尿病风险上升为果。
上述例子表明,当变量X与Y具有相关性但孰因孰果难以确定时,我们可通过引入第三个变量Z来解决问题。变量Z就是所谓的工具变量,其具有的性质是:在理论上,Z影响变量X,但与变量Y没有任何直接关系,同时也与变量Y的其他影响因素缺乏相关性。假若这些性质真的成立,则经验证据一旦表明,变量Z竟然与变量Y存在相关性,我们就可推知:X为因,Y为果。
“给我一个杠杆,我能撬动地球”
在科学研究中,工具变量经常成为研究者识别变量间因果关系的有力杠杆。例如,在2006与2008年两篇论文中,康奈尔大学迈克尔·沃尔德曼教授与合作者研究了儿童观看电视与自闭症风险的因果关系问题。研究发现,过多观看电视的儿童罹患自闭症的风险越高。但是,这并不意味着儿童过多观看电视会引发自闭症,因为无法排除“有自闭倾向的儿童经常看电视,不喜欢户外活动或与人交往”这种反向因果关系的存在。
最后,作者们利用降雨量作为工具变量,厘清了因果关系的方向。作者们认为,降雨越多的地区,儿童呆在室内的时间越长,故更可能长时间观看电视。然而,假若在理论上,降雨量既与自闭症无直接关系,也与自闭症的其他影响因素缺乏相关性,则“降雨越多地区儿童罹患自闭症的风险越高”这一经验事实的存在,就意味着:过多观看电视是儿童自闭症的诱因。
企研数据创始学术顾问 · 姚耀军
姚耀军,1976年出生,湖北利川人,浙江工商大学金融学院教授,博士生导师,浙江省高校中青年学科带头人,浙江省首期之江青年社科学者,企研数据创始学术顾问。曾获中国制度经济学年会优秀论文奖、全国金融硕士教学案例大赛优秀案例奖、浙江省高校优秀科研成果一等奖、《金融研究》优秀论文奖、《财经研究》创刊60周年优秀论文一等奖等荣誉。担任《金融研究》《财经研究》等多个学术期刊的审稿专家。研究领域:金融发展理论与实证、应用计量经济学。
邮箱:yaoyaojun@163.com
代表论文:
[1]姚耀军,施丹燕.互联网金融区域差异化发展的逻辑与检验——路径依赖与政府干预视角[J].金融研究,2017(05):127-142.
[2]姚耀军.制度质量对外资银行进入的影响——基于腐败控制维度的研究[J].金融研究,2016(03):124-139.
[3]姚耀军,董钢锋.中小企业融资约束缓解:金融发展水平重要抑或金融结构重要?-来自中小企业板上市公司的经验证据[J].金融研究,2015(04):148-161.
点击阅读原文,进入CCAD数据库
·END·
星标⭐我们不迷路!
想要文章及时到,文末“在看”少不了!
点击搜索你感兴趣的内容吧
往期推荐
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
文 | 姚耀军
排版编辑 | 青酱
欢迎扫描👇二维码添加关注